% ---------- Esercizio 1: set di dati es1_1.dat ----------------- % Carichiamo i dati ed immettiamo i dati nella matrice % data % Verifichiamo l'ampiezza del campione size(data) % 500 2 %Estraiamo i dati delle colonne 1 e 2 datax=data(:,1); datay=data(:,2); % Calcoliamo gli indici di posizione media e mediana [mean(datax), median(datax)] % 2.0122 2.0449 [mean(datay), median(datay)] % 3.9953 4.0255 % Calcoliamo il massimo ed il minimo [max(datax), min(datax)] % 5.0868 -0.7933 [max(datay), min(datay)] % 8.2653 -0.7039 % Calcoliamo varianza, deviazione standard e differenze interquartili % Nella prima colonna i dati relativi a datax e nella seconda quelli relativi a datay [var(data); std(data);range(data);iqr(data)] % 0.9746 2.0575 % 0.9872 1.4344 % 5.8802 8.9691 % 1.3205 1.9874 % Calcoliamo i percentili con passo 10 prctile(data, [10:10:100]) % 0.7723 2.2112 % 1.1889 2.7920 % 1.5352 3.2904 % 1.7773 3.6339 % 2.0449 4.0255 % 2.2763 4.3376 % 2.5494 4.7291 % 2.8066 5.2305 % 3.1917 5.7395 % 5.0868 8.2653 % Calcoliamo i quartili prctile(data, [25:25:75]) % 1.3430 2.9954 % 2.0449 4.0255 % 2.6635 4.9828 % Calcoliamo Skewness e Curtosi skewness(data) % 0.0183 -0.0433 kurtosis(data) % 3.1275 3.1764 % Calcoliamo la matrice di covarianza dei dati cov(data) % 0.9746 -0.9633 % -0.9633 2.0575 % Disegnamo le scatterplot scatter(datax,datay) % I dati sembrano correlati negativamente % Calcoliamo i coefficienti di correlazione dei dati corrcoef(data) % 1.0000 -0.6803 % -0.6803 1.0000 % Calcoliamo la retta di regressione % coefficienti della retta c=polyfit(datax,datay,1) % -0.9884 5.9841 % Valutiamo i valori di datax sulla retta z=polyval(c, datax); % Valutiamo la bonta` dell'approssimazione lineare % Calcoliamo il vettore dei residui e la sua norma2 r=z-datay; norma2=norm(r) %=sqrt(sum(r.^2)) % 23.4856 ymedio=mean(datay); DT=norm((datay-ymedio))^2 %=sum((int-intmedio).^2) Devianza Totale % 1.0267e+003 DS=norm(z-ymedio)^2 %=sum((z-intmedio).^2) Devianza spiegata % 475.1039 DR=norma2^2 %=sum(r.^2) Devianza residua % 551.5730 R2=DS/DT % e` buono quanto piu` e` prossimo a 1 % 0.4628 % ---------- Esercizio 1: set di dati es1_2.dat ----------------- % Carichiamo i dati ed immettiamo i dati nella matrice % data % Verifichiamo l'ampiezza del campione size(data) % 500 2 %Estraiamo i dati delle colonne 1 e 2 datax=data(:,1); datay=data(:,2); % Calcoliamo gli indici di posizione media e mediana [mean(datax), median(datax)] % 6.9678 6.9127 [mean(datay), median(datay)] % 3.0627 3.0035 % Calcoliamo il massimo ed il minimo [max(datax), min(datax)] % 13.3789 1.5384 [max(datay), min(datay)] % 8.0677 -0.8931 % Calcoliamo varianza, deviazione standard e differenze interquartili % Nella prima colonna i dati relativi a datax e nella seconda quelli relativi a datay [var(data); std(data);range(data);iqr(data)] % 2.9939 1.9923 % 1.7303 1.4115 % 11.8405 8.9607 % 2.3441 1.8830 % Calcoliamo i percentili con passo 10 prctile(data, [10:10:100]) % 4.7542 1.2648 % 5.5085 1.9200 % 6.0146 2.3226 % 6.4465 2.6912 % 6.9127 3.0035 % 7.4188 3.4048 % 7.8136 3.7690 % 8.3842 4.2942 % 9.1366 4.9676 % 13.3789 8.0677 % Calcoliamo i quartili prctile(data, [25:25:75]) % 5.7985 2.1565 % 6.9127 3.0035 % 8.1426 4.0395 % Calcoliamo Skewness e Curtosi skewness(data) % 0.1920 0.0045 kurtosis(data) % 3.3388 2.9628 % Calcoliamo la matrice di covarianza dei dati cov(data) % 2.9939 1.0204 % 1.0204 1.9923 % Disegnamo le scatterplot scatter(datax,datay) % I dati sembrano correlati positivamente % Calcoliamo i coefficienti di correlazione dei dati corrcoef(data) % 1.0000 0.4178 % 0.4178 1.0000 % Calcoliamo la retta di regressione % coefficienti della retta c=polyfit(datax,datay,1) % 0.3408 0.6878 % Valutiamo i valori di datax sulla retta z=polyval(c, datax); % Valutiamo la bonta` dell'approssimazione lineare % Calcoliamo il vettore dei residui e la sua norma2 r=z-datay; norma2=norm(r) %=sqrt(sum(r.^2)) % 28.6463 ymedio=mean(datay); DT=norm((datay-ymedio))^2 %=sum((int-intmedio).^2) Devianza Totale % 994.1638 DS=norm(z-ymedio)^2 %=sum((z-intmedio).^2) Devianza spiegata % 173.5546 DR=norma2^2 %=sum(r.^2) Devianza residua % 820.6092 R2=DS/DT % e` buono quanto piu` e` prossimo a 1 % 0.1746 % ---------- Esercizio 2 ----------------- n=60; p=1/6; p1=binopdf(15,60,1/6) %p1=P(X=15) % 0.0309 p2=1-binocdf(14,60,1/6) %p2=P(X>=15) % 0.0648 p3=1-normcdf((15-n*p-0.5)/sqrt(n*p*(1-p)),0,1) %p3=P(X>=15) con TCL % 0.0595 % Per calcolare il numero minimo di lanci % si tenga presente che % 1-phi((15-n*p-0.5)/sqrt(n*p*(1-p)))>0.9 % e` equivalente a % (15-n*p-0.5)/sqrt(n*p*(1-p))tinv((1+alpha)/2,n-1)/sqrt(n) i=i+1; end i % 114 % ---------- Esercizio 3: set di dati es3_2.dat ----------------- % La formula che restituisce gli estremi dell'intervallo % di confidenza a livello alpha sono % Varianza Nota % xmax=xbar_n+sigma*q_((1+alpha)/2)/sqrt(n) % xmin=xbar_n-sigma*q_((1+alpha)/2)/sqrt(n) % Varianza incognita % xmax=xbar_n+sigma*t(n-1)_((1+alpha)/2)/sqrt(n) % xmin=xbar_n-sigma*t(n-1)_((1+alpha)/2)/sqrt(n) n=80; xbar_n=mean(dati) % 52.4979 sigma=sqrt(var(dati)) % 34.7672 alpha=.9; xmax=xbar_n+sigma*norminv((1+alpha)/2,0,1)/sqrt(n) % 58.8916 xmin=xbar_n-sigma*norminv((1+alpha)/2,0,1)/sqrt(n) % 46.1042 % La semiampiezza e` delta=sigma*norminv((1+alpha)/2,0,1)/sqrt(n); alpha1=.95; nmin=ceil(sigma^2*norminv((1+alpha1)/2,0,1)^2/delta^2) % 114 xmax=xbar_n+sigma*tinv((1+alpha)/2,n-1)/sqrt(n) % 58.9675 xmin=xbar_n-sigma*tinv((1+alpha)/2,n-1)/sqrt(n) % 46.0283 % La semiampiezza e` delta=sigma*tinv((1+alpha)/2,n-1)/sqrt(n); i=n+1; % Calcoliamo il minimo valore di n con un ciclo while while tinv((1+alpha1)/2,i-1)/sqrt(i)>tinv((1+alpha)/2,n-1)/sqrt(n) i=i+1; end i % 114